心理施压攻破安全防线,Anthropic Claude 竟主动输出违禁内容 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn

心理施压攻破安全防线,Anthropic Claude 竟主动输出违禁内容 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。

共 1 篇相关文章

心理施压攻破安全防线,Anthropic Claude 竟主动输出违禁内容

IT之家 5 月 6 日消息,Anthropic 多年来一直将自身打造为主打安全的人工智能公司,但 The Verge 获得的最新安全研究显示,Claude 刻意塑造的友善人设本身或许就是一个安全漏洞。 人工智能红队测试公司 Mindgard 的研究人员称,他们诱导 Claude

tech IT之家 2026-05-06 23:25:46+08:00